CHESTNUT CODE IS POETRY

【短记】证明最小二乘法预测目标值的条件期望

问题描述与符号定义

最小二乘法在面对“逆问题”时会有挑战。比如说我有一个函数$y=f(x)=x^2$,由于x和y之间不是双射,不存在逆映射$f^{-1}$。而如果我使用最小二乘法,通过$y$预测$x$,预测结果会是y对应两个x的均值,导致结果不准确。

考虑有自变量$x = (x_1, x_2, ..., x_n)$,因变量$y = (y_1, y_2, ..., y_n)$,我们希望找到一个函数$f(x)$,使得$f(x)$$y$的均方误差最小。假设模型为线性模型,存在全局最优解。

期望风险和经验风险:过去接触的最小二乘法是基于经验风险的,即基于样本数据的均方误差。这里要注意采样和分布的区别。由于经验风险是期望风险的无偏估计,所以在样本量足够大的情况下,经验风险和期望风险的差异会收敛到0。

理想情况下,我们希望最小化期望风险:

$$ \min_{f} E = \int\int (y - f(x))^2 p(x, y) \mathrm{d}x \mathrm{d}y $$

证明

由于存在全局最优解,那我们希望通过梯度为0找到极值点,该点即为全局最优解:

$$ \frac{\partial E}{\partial f} = 2\int\int (y - f(x)) p(x, y) \mathrm{d}x \mathrm{d}y = 0 $$

观察这个式子,我们可以把$y$$f(x)$放在等号两边,得到:

$$ \int\int y p(x, y) \mathrm{d}x \mathrm{d}y = \int\int f(x) p(x, y) \mathrm{d}x \mathrm{d}y \\ \Rightarrow \int\int y p(y|x) p(x) \mathrm{d}x \mathrm{d}y = \int\int f(x) p(y|x) p(x) \mathrm{d}x \mathrm{d}y \\ \Rightarrow \int p(x) \mathrm{d}x \int y p(y|x) \mathrm{d}y = \int\int f(x) p(x) \mathrm{d}x \int p(y|x)\mathrm{d}y \\ \Rightarrow \mathbb{E}_{y\sim p(y|x)}[y] = \mathbb{E}[f(x)] $$

Return to Blog